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Математические модели анализа многомерных 
данных экологического мониторинга на основе 
теории информационной грануляции 


Предлагаемый интеллектуальный подход к решению задачи сбора, хранения, передачи, обработки и анализа 
многомерных данных, экологического мониторинга средствами дистанционного зондирования основывается 
на систематическом введении методов мягких вычислений и имеющий целью повышение коэффициента 
интеллектуальности систем мониторинга. В результате использования основных идей теории информацион- 
ной грануляции Г. Хадей вводится математическая модель многомерных данных, позволяющая решать все 
указанные задачи мониторинга с помощью методов мягких вычислений — вычислений над образами, или 
формами. 


Введение 


Развитие автоматической интерпретации многомерных данных и ГИС-технологий 
в области экологического мониторинга связано с тем, что человеку с его ограниченным 
трехмерным пространственным воображением сложно, а в большинстве случаев невоз- 
можно, анализировать и давать обобщенные оценки многомерным объектам [1], [2]. 
Существуют различные подходы к организации многомерных данных экологичес- 
кого мониторинга: по характеру решаемых задач, по уровням организации, по природ- 
ным средам, за которыми ведутся наблюдения и т.д. 

Мониторинг охватывает весь широкий спектр анализа наблюдений за меняющейся 
абиотической составляющей биосферы и ответной реакцией экосистем на эти изменения, 
включая как геофизические, так и биологические аспекты, что определяет широкий 
спектр методов и приемов исследований, используемых при его осуществлении. 

Основой процесса дистанционного наблюдения за земной поверхностью [3], [4] 
является визуальное представление многомерных данных (изображения поверхности) 
как двумерной функции, возрастающей в соответствии с откликом различных областей 
на поверхности Земли на внешние источники энергии (луч локатора или Солнце для 
пассивного зондирования). 

Основным качеством данных экологического мониторинга [2-4] является 
многомерность (цветность, мультиспектральность и т.д.). Другим практически важным 
качеством подобных данных является плохая определенность их геометрической фор- 
мы. Общим термином, объединяющим возможные виды искажений информации, в том 
числе и изображений, является «неопределенность» (уаепепез$) [5]. Важнейшим поня- 
тием в рассматриваемой области представления неопределенных и низкокачественных 
изображений является понятие «неопределенного объекта» (уаете гезлоп) [6], введенное в 
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ГИС. Неопределенные объекты чаще всего описываются своей границей. Объекты с 
неопределенной границей можно разделить на следующие классы: 

— объект имеет границу, но ее форма неизвестна, либо не может быть определена пу- 
тем измерений; 

— объекты, которые не имеют определенной границы, или имеют границу, уста- 
новленную условно. К ним относятся и нечеткие объекты, являющиеся предметом 
изучения нечеткой геометрии; 

— объекты, не имеющие границы по определению (температура и влажность воздуха 
ит.п.). Подобные объекты можно представить как множества с определенным на них 
отношением частичного порядка, на котором вводится весовая функция Ф(х,у)=2. 


Классы эквивалентности множества значений скалярного поля, для которых весовая 
функция принимает фиксированные значения 2,1=1,...И, называются областями 


уровня и обычно служат объектами представления и анализа такого рода данных. 

Практически важным классом неопределенных объектов являются природные 
образования, подобные морям, озерам и т.п. В водной среде понятие границы, фор- 
мы объекта быстро изменяется в зависимости от действия множества природных фак- 
торов [7]. Эти свойства объекта изучения определяют спектр задач, решаемых в данной 
работе применительно к системам биологического мониторинга [7]. 


Цель работы 


Целью работы является решение задач, связанных с развитием новых методов интел- 
лектуальной обработки многомерных данных на основе теории информационной гра- 
нуляции (ТИГ) [8] и перцептуального подхода к представлению многомерных данных [9]. 

Нужен подход, позволяющий на единой основе хранить, обрабатывать и анали- 
зировать такие данные независимо от размерности, обеспечивать регулярное представ- 
ление плохо определенных данных, контролировать качество представления, компакти- 
фицировать [10]. Это направление объединяет методы анализа изображений и других 
многомерных данных в ГИС экологического мониторинга [11]. 

Некоторые результаты на этом пути были получены нами в работах по приме- 
нению методов ТИГ к изображениям [9], [10], [12], [13], для нормализованных дан- 
ных (приведенных к осям декартовой системы). Предложенный метод обеспечивает 
регулярное покрытие исходных неопределенных объектов (грануляцию данных) с 
помощью грассмановских гранул в декартовой системе координат [9]. Развитый ме- 
тод позволяет достичь компактности, вычислительной регулярности, оптимизации 
степени сжатия данных и единообразие алгоритмов обработки для данных разной 
размерности в декартовых координатах [12-14]. Однако специфика использования дан- 
ных дистанционного зондирования со спутников, летательных аппаратов (ЛА) и т.п. 
требует инвариантности к поворотам осей системы координат. Кроме того, некоторые 
виды данных представляются в системах координат, отличных от декартовой: напри- 
мер, цветные изображения представляют в цилиндрической и конической системах, 
пространственные неоднородности — в сферической и т.д. [13]. 

В качестве основной цели следует указать создание методологической базы для 
перехода от моделей многомерных данных в декартовых координатах к моделям в 
произвольных ортогональных системах координат и обобщение основных алгоритмов 
обработки и анализа многомерных данных на этот случай. Важной задачей является 
также исследование вопроса о «прозрачности» новых математических моделей для 
пользователей на основе так называемых моделей «стеклянного ящика» [14]. 
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Постановка задачи 


Теоретической основой для развиваемого в наших работах подхода является 
геометрическое истолкование задач и методов гранулирования многомерной информа- 
ции [4], [5], поэтому в качестве математической основы работы выбрана геометрия 
грассмановых элементов, введенная Е. Кет [15]. В работе основные результаты [15] 
обобщаются на модели в произвольных системах ортогональных координат, разраба- 
тываются методики кластеризации гранул, основанные на использовании перцептуаль- 
ного подхода в интеллектуальной обработке информации [13], [14]. 

В качестве области приложений в работе рассматривается задача биомониторинга 
состояния поверхностных вод [2], [7] с использованием в качестве индикатора мор- 
ского фитопланктона, оптическая плотность распределения которого наблюдается с 
низкого спутника или ЛА [3]. В связи с тем, что оптическим агентом фитопланктона 
является хлорофилл, полученные методы мониторинга могут использоваться для 
распространения на другие виды биоиндикаторов состояния среды, такие, как зеленые 
растения литорали и суши. 


Дифференциальные модели неоднородности 
распределения фитопланктона 


К числу важнейших закономерностей развития фитопланктона относится неравно- 
мерность пространственного распределения фитопланктона (пятнистость) [16]. Причиной 
этого явления служит еще недостаточно изученный механизм эктокринного регулиро- 
вания роста фитопланктона. Математические модели используются для анализа 
динамики фитопланктонных популяций в предположении, что фитопланктоном вы- 
деляется биологически активный метаболит, концентрация которого влияет на ско- 
рость роста особей. Однако в силу того, что многие положения, лежащие в основе 
модели эктокринного регулирования, являются качественными, пятнистость является 
скорее качественной, чем количественной характеристикой [16]. При этом колебания 
плотности столь велики, что не могут быть объяснены случайными флуктуациями, и 
визуальная картина такова, что сравнительно небольшие площади высокой плотности 
(«пятна», «облака») разделены пространствами с низкими плотностями, иногда не фик- 
сируемыми стандартными методами наблюдений [2]. Особенно ярко это явление вы- 
ражено в водоемах и районах океана, бедных биогенными элементами, где равномерное 
распределение фитопланктона не обеспечивало бы интенсивности первичного продуци- 
рования, достаточной для развития высших трофических уровней [16]. Результаты чис- 
ленного моделирования по [16] приведены на рис. 1. Они демонстрируют образование 
устойчивых пятен, которые не разрушаются под воздействием течений и сохраняют 
свою форму и размеры. 


а м ш и м ш и мм 
и ^ __\ ‚в ь 


{= 0,05Ть += 0,5То {= 0,95То 


Рисунок 1 — Распределение фитопланктона в Таганрогском заливе 
по результатам моделирования 
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Отметим, что приведенные в [16] результаты моделирования получены с использо- 
ванием большого объема вычислений и требуют времени порядка нескольких суток для 
одного прогноза при использовании двухъядерных персональных компьютеров. С точки 
зрения количественного анализа поведения популяций фитопланктона очевидно, что 
многие принципы, положенные в основу моделирования их роста, являются качествен- 
ными [16], а с другой стороны, исчерпывающий анализ динамики дифференциальных мо- 
делей (например, разработанных в [16]) невозможен в силу отсутствия аналитических 
решений для таких моделей и необходимости значительных затрат времени при чис- 
ленном моделировании. Естественным в такой ситуации кажется применение грану- 
лированных моделей динамики фитопланктона, основанных на идеях перцептуального 
подхода [8], [9] и мягких (качественных) вычислений [12], [13]. Согласно идеологии 
ТИГ такие методы на порядки снижают вычислительную емкость задач [8]. 

Для решения подобных задач необходимы математические модели распределе- 
ния фитопланктона, позволяющие анализировать многомерные данные о наблюдае- 
мой форме его популяций [4] на основе геометрических соображений [11]. Для подоб- 
ных целей в ряде работ использовались методы информационной грануляции [12-14], 
однако они не учитывали целый ряд особенностей геометрии мониторинга с ЛА и 
спутников [3]. Введем основные положения, развивающие эти результаты на данную 
область применения. 


Гранулированные модели многомерных данных 
(распределения фитопланктона) 


Поскольку в ТИГ идеология пространственной грануляции только начинает раз- 
рабатываться [8], то здесь необходима разработка новых подходов. 

Информационной гранулой называется подмножество универсума, на котором 
определено отношение сходства, неразличимости и т.п. [10]. Множество гранул, ко- 
торое содержит все объекты универсума, называется гранулированием универсума. 
Подмножество АСИ называется составной (не элементарной) гранулой, если оно 
представляет собой объединение атомарных гранул [10]. 

Определив на плоскости проекции произвольной гранулы 4, обозначаемые как 
рг.А и рг,А, зададим инкапсулирующую декартову гранулу для произвольного А 


как С” = р". Ах р’, А. Гранула С” является точной верхней гранью конечного множества 


всех гранул, содержащих 4. 

В ряде наших работ [9], [10] была использована алгебраическая модель декартовой 
гранулы, позволяющая компактно кодировать геометрическую информацию в виде 
матриц специального вида, которые Е. Кет назвал «грассмановыми элементами» [15]: 


хх 1 
8(,х,,х,,Уь У, У) =|х У 1|. (1) 
х у 1 


На основе таких элементов Е. Кеш построил полную геометрическую теорию 
для плоскости и пространства [15]. Согласно [15], принципиальную роль для построе- 
ния геометрии гранул (1) играет определитель (1), имеющий геометрический смысл 
суммы алгебраических площадей треугольников, построенных на опорных точках 
элемента (гранулы), как показано на рис. 2а). 
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а) 6) 
Рисунок 2 — Определение базового элемента для плоскости: 


а) в декартовой системе координат (СК), 6) в полярной СК 


Согласно [12], [13], [15], из модели (1) можно получать геометрическую инфор- 
мацию о базовом элементе (в дальнейшем будем называть его гранулой). Так, высота 
и ширина гранулы находятся с помощью следующих миноров базового элемента: 


я 1 
у 1 


д = р ж= 


(2) 


Геометрические характеристики гранулы — периметр, диагональ и площадь гра- 
нулы соответственно — выражаются через миноры базового элемента как 


1 
я 1 х — 
в? | |+, › 1. @) 
- : У» 1 


Базовые модели гранул для различной размерности данных 


Используя принцип инвариантного кодирования геометрической информации 
по [13], мы можем получить уравнения базовых элементов в различных ортогональных 
системах координат. В полярной системе координат гранула 1,2,3,4 может быть 
определена с помощью площадей базовых секторов. По аналогии с (1) введем базо- 
вый алгебраический элемент в полярной системе, заданный предельными значениями 
полярных радиусов р, и р, и полярных углов фи ф,: 


р! р 0 
Ройаг 
8 (рьр.,Ф,Ф,)= фр, Фр 11. (4) 
фр, фр 1 


Распространяя результаты предыдущего раздела на трехмерный случай, легко 
получить по аналогии с (4) уравнение базового элемента в цилиндрической системе 
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координат, заданного предельными значениями полярных радиусов р и р, полярных 


углов ф и ф, ивысот р, и 2,:р 


2’ (рьрефофыияи = (5) 


фр, Фр, ФР. 
фр Фр Фр» 


Наиболее сложными случаями являются алгебраические описания гранул в ви- 
де части усеченного конуса и сферы (рис. 3). 


0 
р р р 0 
1 
1 


У 


а) 
Рисунок 3 — Базовые элементы в конических (а) и сферических (6) координатах 


По аналогии с (5), уравнение базового элемента в конической системе координат, 
заданного предельными значениями полярных радиусов р, и р, ‚ полярных углов фи 


ф, ивысот 2, и 2, , согласно рис. За) запишем в виде: 


2, 2, 0 0 
Ю› Ю› Р\ 0 
“(рр ФФна = 2. 22 22 й (6) 


Фр, Фр, Фзр, 1 
фр, Фр Фр, 1 

Используя (6), мы можем получить уравнение базового элемента в сферической 
системе координат, заданного предельными значениями полярных радиусов р и р., 


полярных углов ф иф иуглов 0, и 0, согласно рис. 36) в виде: 


р р р 0 
с050, со$0, оо 
1 
1 


=° (р,,6.,Ф,,6.,6,,0,)= (7) 


Фр Фр Фр> 
Фр. Фр $>Р› 
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Модели (4 — 7) могут использоваться для нахождения отдельных геометричес- 
ких характеристик криволинейной гранулы путем вычисления определителей ее различ- 
ных миноров. Практический пример, приводящий к необходимости использования 
модели (6), описан в следующем разделе. 


Гранулирование в перцептуальном цветовом пространстве 


Наиболее соответствующей цветовым перцепциям человека моделью восприятия 
цвета является модель НУ, координатами которой являются: Ниче — цветовой тон, 
Зашганоп — насыщенность, Уа№е - яркость. 

Простейшим способом отображения координат НЗУ в трёхмерное пространство 
является использование цилиндрической системы координат. Здесь координата Н 
определяется полярным углом ф ‚ $ — радиус-вектором р ‚ а У — координатой 2 (рис. 4а). 
Чаще применяется коническая цветовая модель, в которой значение радиуса зависит 
от высоты по оси 2 (рис. 46). 


6) 


Рисунок 4 — Цилиндрическая (а) и коническая (6) модели цветового пространства 


В цветовом пространстве НЗУ объект интереса представляется некоторым объеди- 
нением гранул [8] в силу того, что его оттенок Н и насыщенность 5 варьируют из-за 
естественного (или искусственного) изменения видимой цветности объекта [11]. Рис. 5 
показывает результат грануляции по (6) гистограммы яркостей реального спутникового 
изображения. 
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Рисунок 5 — Спутниковое изображение (а) поверхности моря в районе Барселоны и его 
гистограммы яркостей (6) в пространстве КСВ (изображение боо>еЕап В) 
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Рис. 6 показывает результат гранулирования изображения рис. 5а) в цветовом 
пространстве Н$У. 


1 Воваке 30. 


0.8 


0.6, 


Рисунок 6 — Результаты гранулирования гистограммы в конической (а) и в полярной 
(6) системах координат 


Рис. ба) показывает полную гранулированную гистограмму яркостей, построенную 
по модели (6), а рис. 66) — упрощенную гистограмму, полученную путем проецирования 
рис. ба) на плоскость Г = ах . Такое упрощение позволяет, практически не теряя инфор- 
мации, понизить размерность входных данных на единицу. 

К представлению рис. 6 могут быть применены методы обработки многомерных 
данных, описанных в работах [12-14]. 


Выводы 


Введенные в работе модели многомерных гранул позволяют унифицировать алго- 
ритмы представления, передачи, обработки и анализа многомерных данных экологичес- 
кого мониторинга. Они в полной мере реализуют тот факт, что подавляющее большинство 
моделей (в том числе и «точных» дифференциальных) строятся на основе качественных 
рассуждений о механизме эктокринного регулирования фитопланктона. 

Полученные общие результаты позволяют использовать методы гранулирования в 
широком спектре задач (путем выбора соответствующей модели (4 — 7)), в том числе и в 
задачах анализа изображений как данных пассивного оптического мониторинга 
состояния поверхностных вод моря. 

В отличие от распространенных подходов к подобному представлению, осно- 
ванному на выделении некоторых локальных особенностей или признаков, характе- 
ризующих объект [5], предложенное представление является регулярным (в смысле 
некорректно поставленных задач), поскольку основано на процессе инкапсуляции 
(покрытия) гранулами по Г.. Хадей и использовании оценок площадей полученных 
декартовых гранул, что является аналогом интегрирования (в широком смысле этого 
слова) по подмножествам декартова произведения. Предложенные унифицирован- 
ные алгебро-геометрические модели могут быть широко использованы при построе- 
нии интеллектуальных систем анализа многомерных данных, «прозрачных» для поль- 
зователя или систем типа «стеклянного ящика» [14] в противовес гранулированным 
моделям типа «черного ящика» [5]. В результате они полностью реализуют все преи- 
мущества информационной грануляции, заявленные в [8]. 
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С.А. Бутенков 

Математичн! моделЕ для анал зу багатовим!рних даних на основ! теорй нформащИно! грануляцй 
Пропонуеться 1нтелектуальний шдяд до розв’язання задач! збору, збергання, передачу, обробки 1 аналзу 
багатовим!рних даних, еколог!ичного монйторингу засобами дистанщиного зондування, заснований на 
систематичному введенн! методв м’яких обчислень 1 такий, що мае на мет! шдвищення коефицента 
1нтелектуальност! систем мошторингу. В результат! використання основних 1дей теорй 1нформащийно! гра- 
нуляци Г. Хадев вводиться математична модель багатовимрних даних, що дозволяе вирппувати вс! вказан! 
завдання мон!торингу за допомогою метод!в м’яких обчислень — обчислень над образами, або формами. 


5.А. Вшепнкоу 

Ма@ветайса| Моде оЁ Есо!051са! МопНогто Мшадтепт$!0пта! аа Апа[у$15 ВазеЯ 

оп Ме огтайоп СтапШайоп Твеогу 

ТЬ$ рарег 4еа15 Ив Ше регзреснуез о# пе\\ арргоась {0 фе соттоп ргоет о# пи] НАплепз1опа] даёа оЁ 
соПесйоп, тап$1715$10п, ргосеззте ап4 апа1уз15. ТНе плат 14еа 1$ ге] е4 ул Фе зо сотрийп® ришс1р]ез 
ап аппз Фе МТО ирдайп® ассог4те фе тат ргороз оз оЁ Егтайоп Сгапшайоп ТВеогу, ргорозе4 Бу 
Г. Гадев. Тве пе\ Кш4 оё зо сотрийте орегаНоп$ (сотрини» \ зВарез) 15$ ргорозе4 ап чзе4 Юг 
заеПие со]ог ппарез гергезепйаноп ш сотрас Ююгт. 
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